All Posts
News bits
Gemini Deep Research のビジュアルレポート機能
Gemini Deep Researchがビジュアルレポート機能を強化した。Google AI Ultra加入者向けに、カスタム画像、チャート、インタラクティブシミュレーションを含むリッチなレポートを自動生成可能になった。
Google AI、Interactions APIが発表
Googleが「Interactions API」を発表した。これはGeminiモデルやエージェントと対話するための統一されたインターフェースであり、現在はパブリックベータとして提供されている。
Julesにプロアクティブなコーディング機能の追加
Google Labsのコードエージェント「Jules」に、プロアクティブなコーディング機能が追加された。ユーザーからの指示を待つだけでなく、バックグラウンドで自律的にタスクを提案・実行することが可能になった。
Gemini 2.5 DeepThink の発表
GoogleがGemini 2.5 DeepThinkを発表。複雑な問題に対し、複数のアイデアを同時に生成・評価・修正して、より創造的で思慮深い回答を導き出す「並列思考」技術を搭載。
NotebookLM、ビデオ概要とStudioパネルのアップグレードを発表
パーソナライズされたAIリサーチアシスタントであるNotebookLMが、新機能として「ビデオ概要(Video Overviews)」の生成と、「Studioパネル」のアップグレードを発表。複雑なトピックの理解やコンテンツ作成を支援する機能が強化された。
Veo 3 Fastの導入とimage-to-video機能の追加
Googleの動画生成モデルVeo 3に、速度と価格を最適化した新モデル「Veo 3 Fast」が追加。あわせて、既存のVeo 3とVeo 3 Fastの両方で、静止画から動画を生成するimage-to-video機能が利用可能になった。両モデルと新機能は、Gemini APIを通じて有料プレビューとして提供される。
LangExtract: Geminiを活用した情報抽出ライブラリ
GoogleはLangExtractを発表。これは、非構造化テキストから構造化情報を抽出するための新しいオープンソースPythonライブラリ。GeminiのようなLLMを利用し、ユーザーのカスタム指示に基づいて、柔軟性と追跡可能性を両立した情報抽出を実現する。医療レポートや法的文書など、テキストが多用される分野での活用が期待される。
著者について
Hi there. I'm hrdtbs, a frontend expert and technical consultant. I started my career in the creative industry over 13 years ago, learning on the job as a 3DCG modeler and game engineer in the indie scene.
In 2015 I began working as a freelance web designer and engineer. I handled everything from design and development to operation and advertising, delivering comprehensive solutions for various clients.
In 2016 I joined Wemotion as CTO, where I built the engineering team from the ground up and led the development of core web and mobile applications for three years.
In 2019 I joined matsuri technologies as a Frontend Expert, and in 2020 I also began serving as a technical manager supporting streamers and content creators.
I'm so grateful to be working in this field, doing something that brings me so much joy. Thanks for stopping by.